看到AI检测系统里,毕业论文成片的红色和黄色时,舒然感到“欲哭无泪”。她在心里反问自己:难道我长得这么像AI吗?
在舒然两万三千字的论文中,有几十段文字被检测出“中风险”和“高风险”。舒然解释,这意味着自己的毕业论文虽是原创的,却因为“AI率较高”无法达到学校论文过审的要求。
随着AI的流行,不乏学生会在论文写作时借助AI生成。根据一些高校的官网消息,针对2024届毕业生,这些学校首次发布了有关AIGC(生成式人工智能)检测的通知,明确学生在进行毕业设计(论文)时,应严格遵守学术规范和学术道德,避免过度依赖智能生成内容,确保毕业设计(论文)的独立性和原创性。
接受采访的学生们都认为,AI检测某种程度上的确可以防止学生用AI代写论文,但是目前的AI检测功能尚不成熟。“很难理解它是怎么判断为AI写作的,因为就算是人工写作,或者经过修改,也会再次检测成AI代写。”舒然说,用科技制裁科技的结果,会导致跟论文的要求相反。
对于那些被误判为AI写作毕业论文的学生,机器反馈给他们一个数字,他们没有申诉途径,只能按照机器的运行逻辑修改。一个明显的悖论是,当人工智能越来越像人类时,人类自己写的句子也越来越像人工智能。此时,用AI检测是否使用AI代写,他们的论文被误判为AI代写的可能性就越高。
从“中风险”改到“高风险”
今年4月底,即将大学毕业的舒然和导师讨论后,定下了自己毕业论文的题目。
一个月后,舒然开始写论文初稿。撰写论文期间,她已经进入一家公司实习。每天下班后,她趴在电脑前绞尽脑汁,写到半夜才休息。周末两天,她把所有时间都投入到论文写作中。
因为提前和导师商量好了论文的结构框架,写作过程中,舒然的思路较为清晰和顺畅。除此之外,导师对她的论文格式,包括目录、字体、表格的线条等都提出了更细致的要求。
大概过了半个月,她写完论文初稿。按照学校的要求,她的毕业论文字数要在两万以上。一遍遍修改后,舒然的论文字数停留在两万三千字。
学校的另一个要求是,除了一般的查重外,学生需使用一款叫“格子达”的AI工具作为论文引用检测系统,检测的结果必须是“低风险”。
舒然通过上网查询得知,这款软件能够提供论文查重、格式检测、格式校正、论文管理等功能。论文查重主要通过与期刊数据库比对,找出论文中内容的重复率。
不同的查重系统算法和数据库大小不一样,比如知网查重的规则是13个字符,即6.5个字连续重复就会被标红。而AI检测的目的在于识别出哪些内容是由AI生成,通过分析语言风格、检测重复内容、语法和逻辑进行判断。
写完论文初稿一个星期后,舒然发给导师。导师提出修改意见后,她从标题到框架全部“人工”修改了一遍,直到对自己满意为止。在答辩前两周,她将论文提交到AI工具里检测。
在舒然提交之前,她的一个室友先进行了AI检测。结果是查重率13%,AI检测“中风险”。室友对此结果并不意外,她告诉舒然,自己的论文有一部分是AI代写的。
当时舒然觉得“还挺新奇”,但她心想,这样的论文肯定重率高,自己的论文都是一个字一个字写的。当舒然把论文提交后,出现在她眼前的查重率只有1%,但AI报告也是“中风险”。
这意味着,她必须降AI率,从“中风险”降到“低风险”。
和舒然一样,四川大学生林天乐的毕业论文也被判定为AI代写。今年毕业前两个月,林天乐突然接到学校要求查AI率的通知。交论文截止日期的前一天,他才知道学校要求学生使用维普论文检测系统,系统显示,可以用AI语言模型检测AIGC实现快速、准确识别学术文本中的AI生成内容,可有效识别文本是否部分或全部由AI模型生成,检测结果与论文质量无关,仅表示论文中内容片段存在AI生成可能性的概率。
林天乐学校要求,AI率要低于30%。超过这个比例,论文盲审不能通过,就无法毕业。他上传论文后,查出来的结果是37%。林天乐表示,标成AI的那些内容,都是他自己写的。
在这之前,他已经在知网上查过一遍,查出来的重复率是百分之零,所以他对自己的论文比较放心。直到要交初稿的当天,老师建议他再加新的内容进去,他又继续修改,到下午才定稿。“感觉自己这么努力,到交之前还手忙脚乱, AI率却被判为37%,内心挺气愤的。”
林天乐在社交平台上吐槽检测结果。